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L objectif d’une etude n’est pas I’etude par elle-meme, 
mais une question plus generale a laquelle elle tente de 
repondre. Lorsqu’un essai comparatif randomise vise a 
comparer I’efficacite d'un « nouveau traitement » a celle du « trai- 
tement de reference », la question n’est pas de savoir si I’alterna- 
tive therapeutique est plus ou moins efficace que le traitement de 
reference pour les seuls patients inclus dans I’etude, mais d’ex- 
traire, a partir des resultats de I’etude, des elements permettant 
d’estimer la difference d’efficacite reelle des deux traitements. 
Interpreter les resultats d’une etude c’est se poser la question de 
I’information apportee par cette etude, de la connaissance qu’il 
est possible d’extraire de ses resultats. Cette demarche s’ap- 
plique aussi bien a revaluation des therapeutiques, a revaluation 
des tests diagnostiques qu’a I’ensemble de la recherche epide- 
miologique. 

Les fondamentaux de biostatistique pour la lecture critique 
d’article (LCA) sont communs aux differents domaines de la 
recherche clinique et de la recherche epidemiologique. Cet article 
presente rapidement ces fondamentaux. 

Adequation du dessin de I’etude a i’objectif 
de la recherche 

Le dessin de I’etude doit etre adapte a la question posee. La 
question a I’origine de I’etude constitue I’objectif principal. Le plan 
d'analyse statistique decoule du dessin de I’etude [v. tableau 1). 
Des objectifs secondaires peuvent etre definis, conduisant a 
completer le dessin d'etude et le plan d’analyse. Neanmoins, I'ade- 
quation du dessin de I’etude a I’objectif principal reste le premier 
element de validite de I’etude. Un dessin inadapte ne pourra pas 
fournir de reponse a la question posee. 


La typologie des etudes epidemiologiques conduit a distinguer 
les etudes epidemiologiques descriptives des etudes epidemio- 
logiques analytiques. 

Les etudes epidemiologiques descriptives ont pour objectif de 
caracteriser les maladies. Les etudes d’incidence decrivent la 
survenue des maladies au niveau des populations. Elies repon- 
dent aux questions « qui ? » (p. ex. variation du taux d’incidence 
en fonction du sexe ou de I’age), « quand ? » (p. ex. variation tem- 
porelle du taux d’incidence), 1 « ou ? » (p. ex. variation geogra- 
phique du taux d’incidence). 2 Des registres ont ete mis en place 
pour analyser I’incidence des maladies chroniques (p. ex. can- 
cers, maladies cardiovasculaires...) au niveau des populations. 
Ces structures enregistrent les cas incidents sur une base 
geographique bien definie. Une vingtaine de registres departe- 
mentaux du cancer existent en France (http://www.invs.sante.fr/ 
survei I lance/can cers/survei I lance_cancers. htm) . L’analyse des resultats 
des etudes epidemiologiques descriptives peut generer des 
hypotheses etiologiques. Ainsi, une incidence accrue des cancers 
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des voies aerodigestives superieures chez I’homme, et dans le 
Nord de la France, a pose la question du role de I’alcool, seul ou 
associe au tabac, dans I’origine de ces cancers. 3-5 

Les etudes epidemiologiques analytiques ont pour objectif de tester 
des hypotheses etiologiques, en particulier celles generees par 
les etudes epidemiologiques descriptives, et d’estimer le niveau 
d'association entre I’exposition aux facteurs de risque potentiels 
et la probability de survenue des maladies. La typologie des etu- 
des epidemiologiques analytiques conduit a distinguer les etu- 
des de cohorte (dans lesquelles le dessin d’etude suit la 
sequence exposition-maladie) des etudes cas-temoins (dans 
lesquelles le dessin d’etude suit la sequence inverse). 

Dans les etudes de cohorte sont inclus des sujets initialement 
indemnes. Leur exposition aux facteurs de risque potentiels est 
enregistree tout au long de leur suivi, jusqu’a /eventuelle survenue 
de la maladie. Citons, par exemple, une des premieres etudes qui 
met en evidence I’association entre I’exposition a I'amiante et le 
risque de survenue de mesotheliome. 6 Bien des etudes de 
cohorte sont connues par le nom des cohortes, par exemple la 
cohorte Framingham qui s’interessait initialement aux facteurs 
de risque de maladies cardiovasculaires (http://www.framingham 
heartstudy.org/about/history.html), la cohorte Gazelle qui a suivi des 
employes d’EDF-GDF. Le recueil d’informations dans le cadre de 
larges cohortes depasse classiquement le cadre initial de P etude 
et permet de mener des etudes complementaires. 

Dans les etudes cas-temoins, le statut des sujets, cas (malades) 
ou temoins (indemnes) est connu au moment de leur inclusion dans 
I’etude. Est alors recherchee leur exposition aux facteurs de risque 
potentiels anterieure a leur inclusion dans I’etude. C’est le schema 
de I’etude INTERPHONE actuellement menee pour etudier la rela- 
tion eventuelle entre utilisation de telephones portables et cancers 
de la tete. 7 ' 8 Des etudes cas-temoins ont ainsi permis d’estimer 
/augmentation du risque de cancer des voies aerodigestives supe- 
rieures en fonction de la consommation d’alcool et de tabac. 4 

Tres schematiquement, les etudes de cohorte sont adaptees 
aux expositions rares, les cohortes etudiees pouvant etre selec- 
tionnees en fonction d’une prevalence de I’exposition aux fac- 
teurs d’interet plus elevee qu’en population generate. Les etudes 
cas-temoins ne sont envisageables que lorsque la maladie est 
rare dans la population, I 'odds ratio fournissant alors une estima- 
tion acceptable du risque relatif. Les etudes cas-temoins nichees 
dans une cohorte represented une solution a la situation particu- 
liere ou, a la fois, I’exposition et la maladie sont rares. L’ etude 
cas-temoins est alors realisee dans une cohorte dans laquelle 
/exposition est plus elevee qu'en population generate. 

Les differentes etapes de /evaluation de I’efficacite et de la toxicite des 
therapeutiques chez I'homme correspondent a des dessins d’etude 
standardises. Le dessin des essais cliniques controles randomises 
de phase 3 se distingue de celui des etudes de cohorte. En regie 
generate, ces deux types d’etude integrent le suivi prospectif 
d’un ensemble d’individus jusqu’a la survenue eventuelle de I’eve- 
nement etudie. II existe une difference fondamentale. Dans les 


etudes epidemiologiques, I'exposition aux facteurs de risque fait 
I’objet d'une observation. Dans I’essai therapeutique de phase 3, 
I’exposition aux therapeutiques correspond a une intervention, 
fixee a I’issue de la randomisation. Le dessin d’etude d’un essai 
therapeutique controle randomise est ainsi celui d'une veritable 
etude experimentale. 9 

L’estimation de /ensemble des performances d’un test diagnostique 
(sensibilite, specificity, valeurs predictives positive et negative) 
dans une meme etude ne peut etre effectuee que si la probability 
qu’un sujet soit inclus dans I’etude est independante de son sta- 
tut (malade-non malade) et du resultat du test (positif-negatif). 
Cet echantillonnage n’est qu’exceptionnellement realise au profit 
d’un dessin d’etude de type cas-temoins. La sensibility y est 
alors estimee chez les malades, la specificity chez les sujets 
indemnes. Les valeurs predictives positive et negative ne peu- 
vent alors etre estimees qu’indirectement a partir des estima- 
tions de la sensibility et de la specificity fournies par I’etude, et 
d’une estimation de la prevalence de la maladie issue d'etudes 
epidemiologiques descriptives anterieures. 

Inference statistique 

L’analyse statistique des resultats de I’etude decoule de la theo- 
rie d’echantillonnage. Seuls les echantillons aleatoires, c’est-a-dire 
tires au sort, sont representatifs de la population, c’est-a-dire a meme 
de fournir des estimations non biaisees du parametre d’interet. En 
fonction de /objectif, se distinguent les etudes menees sur un echan- 
tillon unique pour /estimation d’une probability, d’une moyenne ou 
d’un taux, de celles menees sur plusieurs echantillons pour estimer 
une difference de probabilites de guerison, un risque relatif, un odds- 
ratio, une difference de moyennes, un taux relatif d'evenement. 

La notion d’echantillon aleatoire peut revetir differents aspects. 
Meme si la theorie d’echantillonnage est omnipresente, il n’y a 
pas toujours, a proprement parler, tirage au sort du ou des 
echantillons. Un exemple remarquable est celui des registres du 
cancer qui disposent de /ensemble des cas incidents de cancer 
pour le departement concerne (donnees exhaustives). Pour 
autant, le caractere aleatoire de I’evenement est pris en compte 
dans /analyse, et les taux d’incidence sont estimes ainsi que leurs 
intervalles de confiance. 

Dans les etudes epidemiologiques cas-temoins, les cas de I’e- 
tude sont consideres comme appartenant a un echantillon alea- 
toire des malades, et les temoins comme appartenant a un 
echantillon aleatoire des sujets indemnes. S’il arrive dans certaines 
etudes que les temoins constituent reellement un echantillon 
aleatoire de sujets indemnes (tirage au sort a partir de registres 
administratifs), il n’y a jamais d’echantillonnage aleatoire des cas. 
Les probabilites d’inclusion des cas ou des temoins dans I’etude 
doivent etre independantes de leur niveau d’exposition. II y a 
biais de selection lorsque la probability d’inclusion des cas ou 
des temoins dans I’etude depend de leurs niveaux d’exposition. 
Les etudes cas-temoins sont des etudes echantillonnees bien 
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qu’il n’y ait pas d'echantillonnage a proprement parler. Le choix 
des criteres d’inclusion des cas et des temoins vise a eviter le 
biais deselection. 

Dans I’essai randomise, il n’y a pas tirage au sort des sujets qui 
participent a I’essai, mais tirage au sort, parmi les patients selec- 
tionnes, des patients recevant I’un ou I’autre des traitements. Ce 
tirage aleatoire vise a rendre, en moyenne, les groupes compara- 
bles. (.’interpretation des resultats prend en compte cette com- 
parability initiale des groupes. 

Test d’hypothese et estimation d’un parametre 

Test d’hypothese 

Se distinguent classiquement les tests effectues sur echantillon 
unique de ceux effectues sur plusieurs echantillons. L’hypothese 
testee est toujours I’hypothese nulle. Cette hypothese nulle est 
que I’echantillon unique provient de la population de reference, 
ou que les deux echantillons compares proviennent d’une meme 
population. 

La statistique du test repose sur la valeur prise par une variable 
aleatoire de distribution connue sous I’hypothese nulle. 

Comparer la valeur d'une moyenne observee sur un echantillon 
unique a une valeur de reference revient a calculer, sous I’hypothese 
nulle, la probability d’observer une valeur au moins aussi eloignee 
de la valeur de reference que celle observee sur I’echantillon. 

Comparer les valeurs des moyennes observees sur deux 
echantillons revient a calculer, sous I' hypothese nulle que ces 
echantillons proviennent d’une meme population theorique, la 
probability d’observer un heart entre ces moyennes au moins 
aussi important que I 'heart observe. 

Dans les deux cas, la probability calculee s’appelle le degre de 
significativite du test, le « petit p ». 

La valeur du seuil de significativite est fixee dans le protocole de I'etude. 
C’est le risque d’erreur de premiere espece (risque a), risque consenti 
de rejeter I'hypothese nulle alors qu’elle est vraie (v. figure). 

Une valeur classiquement choisie est a = 5 %. Une valeur du 
degre de significativite inferieure au seuil de significativite conduit 
au rejet de I’hypothese nulle jugee trop peu vraisemblable. Le 
test est alors dit significatif. Une valeur du degre de significativite 
superieure au seuil de significativite ne permet pas le rejet de I' hy- 
pothese nulle. Le test est alors dit non significatif. 

De fagon symetrique, on definit le risque de ne pas rejeter I'hypothese 
nulle alors qu’elle est fausse (e’est-a-dire ne pas conclure a une 
difference alors que cette difference existe). C’est le risque de 
seconde espece (risque (?) [v. figure]. Cette probability n’est define que 
lorsqu’une hypothese alternative particuliere est specifies a priori. 

Cette hypothese alternative correspond a la valeur attendue de 
la probability, de la moyenne ou du taux pour les etudes menees 
sur echantillon unique. 

Pour les etudes comparatives, elle correspond a la difference 
attendue entre les probabilites de guerison, a la valeur attendue 
du risque relatif, de Vodds ratio ou du taux relatif. 


Ho H, 



la[tllli|!> Fluctuation d’echantillonnage de la grandeur test sous HO et HI 

(cas d’un test unilateral). 


La puissance est le complement a 1 du risque de seconde 
espece (puissance = 1 -(?). C’est la probability de rejeter I’hypo- 
these nulle sous I’hypothese alternative specifiee a priori. Le rejet 
de I'hypothese nulle a I’issue de I'analyse ne signifie pas (’accep- 
tation de I’hypothese alternative specifiee. 

Le nombre de sujets necessaire est le nombre de sujets permettant, 
sous I’hypothese alternative specifiee et pour un risque de pre- 
miere espece fixe, de rejeter I’hypothese nulle avec la puissance 
desiree. Le calcul du nombre de sujets necessaire requiert done 
de specifier : I’hypothese alternative, les risquesd'erreuraet (?, le 
caractere uni- ou bilateral du test realise, et en cas d'analyse 
comparative le rapport des effectifs des deux groupes. Le nombre 
de sujets a inclure au final doit, en plus, integrer une eventuelle 
proportion de perdus de vue. 

Dans I’essai therapeutique comparatif randomise, lorsque la 
duree d’inclusion est longue par rapport au delai d’obtention du 
critere de jugement principal, une ou des analyses intermediates 
du critere de jugement principal peuvent etre planifiees. Le calcul 
du nombre de sujets necessaires prend alors en compte ces 
analyses intermediaires. 

Estimation de la grandeur d’effet 

Un test d’hypothese significatif ouvre I’analyse. II indique que la 
probability « p », calculee sous I’hypothese nulle, d’une valeur au 
moins aussi eloignee de la valeur attendue que la valeur observee 
est trop peu vraisemblable. Dans le cas de I’essai therapeutique 
randomise, une valeur de « p » inferieure au seuil de significativite 
indique qu’il y a une difference d'efficacite, mais n’indique pas 
I’ampleur de cette difference, qu’il convient d’estimer. 

L’etape suivante est I’estimation ponctuelle du parametre 
d'interet et I’estimation de son intervalle de confiance. II s'agit de 
I’intervalle dans lequel la vraie valeur a une probability (1-a) pre- 
alablement definie de se trouver. Par exemple, un intervalle de 
confiance a 95 % est un intervalle ayant une probability de 95 % de 
contenir la vraie valeur du parametre d’interet. Le risque d’erreur, a, 
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i Tests statistiques (analyse univariee) et modeles statistiques (analyse multivariee) couramment utilises 
| selon la nature des comparaisons effectuees a partir des donnees de deux echantillons 

Comparaison 

Tests statistiques usuels (analyse univariee) 

Modeles statistiques usuels (analyse multivariee) 

De 2 probability 

1 Test du Chi 2 

1 Test exact de Fisher 

1 Regression logistique 

De 2 moyennes 

1 Test de Student 

1 Analyse de variance a plusieurs facteurs 


1 Test de Mann et Whitney 

1 Regression lineaire multiple 

De 2 distributions de survie 

1 Test du log Rank 

1 Modele parametrique, ou semi-parametrique (Cox) 
d’analyse de la survie 


est ici aussi frequemment fixe a 5 %. II s’agit de I’intervalle de 
confiance de la probability, de la moyenne, ou du faux pour la 
population d’ou provient I’echantillon unique, de celui de la diffe- 
rence des probability, du risque relatif, de I 'odds-ratio, de la dif- 
ference des moyennes, ou du faux relatif lorsque sont compa- 
rees deux populations. La largeur de I’intervalle de confiance est 
directement liee a I’estimation de I’erreur type de la grandeur 
d’effet estimee. Elle depend done de lataille de I’echantillon (des 
echantillons). Cette erreurtype diminue lorsque lataille de P etude 
augmente ; des etudes de taille importante permettent d'obtenir 
des intervalles de confiance plus etroits. Ainsi, pour un meme 
risque d’erreur a, des etudes de grande taille fournissent des 
estimations plus precises des grandeurs d’effet estimees. 

Les notions d’intervalle de confiance et de test de I’hypothese 
nulle sont etroitement liees. Ainsi, un intervalle de confiance a 95 % 
(a = 5 %) d’une difference de probability n'incluant pas la valeur 
0 conduit au rejet de I'hypothese nulle d’egalite des probability 
au seuil de significativite a. De fagon similaire, si I’intervalle de 
confiance a 95 % du risque relatif, de I ’oc/ds ratio , ou du taux 
relatif ne comprend pas la valeur 1 , on dit que le risque relatif, 

I 'odds ratio ou le taux relatif est significativement different de 1 au 
seuil a = 5 %. 

Les modeles statistiques ne sont pas specifiques du dessin 
des etudes mais de la comparaison effectuee (tableau 2). A titre 
d'exemple, le modele de regression logistique et le modele de 
Cox sont autant utilises dans les etudes epidemiologiques d’ob- 
servation que dans les essais therapeutiques randomises. 


Analyse univariee, analyse multivariee 

Alors que I 'analyse univariee consiste a etudier chaque facteur 
separement, I’analyse multivariee est par definition ajustee sur 
les facteurs de confusion potentiels. Les modeles multivaries 
permettent de prendre en compte I’effet d’eventuels facteurs de 
confusion au moment de I'analyse, en particulier les facteurs cor- 
respondent au dessin de I’etude. L’analyse multivariee permet 
d’estimer I'ampleur d’effet d’un facteur a niveau fixe des autres 
facteurs pris en compte dans le modele. L’analyse multivariee 
permet I’etude des eventuelles interactions, e’est-a-dire la modi- 
fication de I’effet d’un facteur sur le critere etudie en fonction de 
la presence de I’un ou de plusieurs autres facteurs. 

De plus, la modelisation de la relation entre un critere de jugement 
et un facteur autorise P etude de la forme de cette relation. En parti- 
culier peut etre prise en compte revolution du facteur, et de son 
effet en fonction du temps. C’est a cette etape de I’analyse, lors 
de la modelisation, que la repetition de mesures peut etre specifi- 
quement prise en compte a I’aide de modeles a effets mixtes.* 

Remerciements aux Drs Nadine Bossard et Muriel Rabilloud pour leurs commentaires 
sur une version anterieure du document. 
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